iT邦幫忙

第 11 屆 iThome 鐵人賽

DAY 5
0
AI & Data

AI&Machine Learning系列 第 5

Data 大數據(儲存資料)

  • 分享至 

  • xImage
  •  

本文將會介紹把抓取下來的資料,彙整完以後將資料儲存至電腦之中,本篇也會針對python來做為介紹,在這提出儲存資料的主軸時先提出額外的語法觀念。

with open("路徑","方法") as 參數 :
    print(參數)

在以上的方法中是簡單將資料開啟做讀取或者是寫入動作,改變方法為"方法"中,"路徑"為檔案的位子,參數為將一整個下來的檔案參數,https://www.itread01.com/content/1549615343.html 此網站為 with open 系列做法,以及各種方法參數的設置,本人也是從上方網址開始學習的。

話題切回來,如果知道一個簡易的存檔,以及寫入的程式,那接下來可以切入比較進階的方式,以本人來說以儲存資料來講,我是以Excel格式為主,因為Excel格式較為工整,而且若是要轉成圖檔可以直接在Excel中完成,雖然上一篇有教導人家說可以利用 pandas 做圖表產生,但是如果今天大家的檔案都是在Excel中,其實可以很簡單的直接把表格變成圖形化,附上連結 https://support.office.com/zh-tw/article/%E5%BB%BA%E7%AB%8B%E5%9C%96%E8%A1%A8%E7%9A%84%E5%AE%8C%E6%95%B4%E6%B5%81%E7%A8%8B-0baf399e-dd61-4e18-8a73-b3fd5d5680c2 此連結關於Excel。

所以我們該如何放入Excel中呢,在python上有一種模組叫做 openpyxl 此模組中可以建立Excel sheet 以及可以直接針對整個excel 表格範圍做操作 https://blog.techbridge.cc/2018/10/05/how-to-use-python-manipulate-excel-spreadsheet/ 附上連結為 openpyxl 的方法。

from openpyxl import load_workbook

wb = load_workbook("Example.xlsx")
print(wb)

以上 load_workbook方式是為叫出檔案的狀態,以及針對這個檔案可以開始做程式編輯,但是要有這個檔案之前其實是要做出有儲存這份檔案的動作,所以前面才有介紹到 with open 方式,大家可以藉著去參考這方法, 其實 with open 以及 openpyxl 本人常常拿來做運用,若是對於儲存第一步有困難,其實還有第三種方式可以先做處理 xlwt https://codertw.com/%E7%A8%8B%E5%BC%8F%E8%AA%9E%E8%A8%80/357164/ 參考連結附上,此xlwt方式其實跟前面兩種有雷同的地方,只是說這個方法很淺顯易懂,當初還不知道前兩個方法怎麼產生檔案時,有嘗試過xlwt,確實不錯,若是有這方面疑惑的人也可以嘗試這樣看看。

連結上所介紹給各位的是,先將Excel的路徑以及 sheet 名稱 大小 先決定完畢再將整個Excel做儲存,這個方式雖然有冗長了一些,但是也是確保你的Excel檔案是否有在你的使用範圍內,因為以程式來說太多餘的記憶體真的會造成電腦不太順的狀況。

以上為不專業AI介紹,本篇到此結束,下篇進度為從擷取資料,彙整資料 儲存資料的細節討論分為三篇作為探討,那我們下次見~~~~~

上一篇
Data 大數據(彙整資料)
下一篇
Data 大數據(攝取資料)探討 Day 6
系列文
AI&Machine Learning30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言